案例解析:沃尔夫奖得主何川教授Science发文揭开m6A领域的长期谜团 | m6A专题
N6-甲基腺嘌呤(m6A)是哺乳动物mRNA内部最常见、研究最为广泛的修饰,这种可逆的修饰对于多种生理学过程中的基因表达有着广泛深刻的影响。m6A修饰失调则与癌症、神经系统疾病、胚胎发育迟缓等病症相关。众所周知,以前发现的m6A效应蛋白根据其活动主要分为三类,催化m6A甲基化的 "writers",优先结合m6A的 "readers",以及逆转m6A甲基化的 "erasers"。
而就在最近,美国芝加哥大学何川教授团队在m6A研究领域取得了重要突破。该团队鉴定了第一个m6A“抑制器”——EJCs,即广泛抑制m6A沉积的"suppressors"。这项研究当中,他们发现了一个普遍存在的调控机制,即通过有针对性地抑制未甲基化区域的m6A甲基化水平,可以将m6A甲基化限制在特定的转录本区域。他们鉴定出的外显子剪接复合体(EJCs)作为m6A“抑制器”,可以调控mRNA m6A的区域选择性,从而决定了全局m6A表观分布特异性。外显子体系结构(exon architecture)也通过这一机制影响了mRNA稳定性。这一发现还表明,外显子体系结构通过对外显子结(exon junction)近端的mRNA包装,广泛决定了mRNA调控机制对于局部RNA的可及性。
那么何川教授团队是如何取得此项突破的呢?就让我们一起来详细了解一下吧。
论文标题:Exon architecture controls mRNA m6A suppression and gene expression
刊登日期:2023年02月
发表杂志:Science
影响因子:63.714
研究机构:芝加哥大学生物物理动力学研究所
技术手段:MeRIP-seq、MPm6A
一、m6A的大规模平行检测
首先作者提出了两个问题:
当一个m6A甲基化位点与它的内源环境脱钩时,围绕该位点的局部序列是否足以指定该位点的甲基化?
反之,当未被甲基化的DRACH位点与其内源性环境脱钩时,其周围的局部序列是否足以阻止该位点的甲基化?
为了解决这两个问题,作者开发了一种针对m6A甲基化的大规模平行检测(MPm6A)方法,来系统性评估表观转录组尺度下影响m6A甲基化的决定性因素。一开始作者就惊喜地发现,m6A甲基化的全局分布特异性主要由m6A“suppressors”通过选择性抑制靶向转录本特定区域的m6A甲基化来进行控制。这一发现颠覆了目前对于m6A甲基化选择性研究的范式(图1A)。
在MPm6A工作流程中,作者合成了数千个内源性甲基化的m6A位点和内源性非甲基化的DRACH位点,每个位点周围有102个核苷酸的序列,并克隆到一个基于质粒的无内含子GFP转基因的3′UTR中。对于每个序列,作者还设计了一个相应的阴性对照序列,其中所有的DRACH位点都发生了突变以防止甲基化。这些序列被表达,然后通过转染到细胞中进行m6A甲基化。每个单独序列的甲基化状态是通过其在mRNA的m6A IP后的富集水平来评估的。作者选择了6897个m6A位点和3058个未甲基化的DRACH位点在HeLa细胞中进行检测,并验证了该检测的精确度和准确性(图1B-D)。
图1
二、广泛的mRNA m6A抑制控制m6A表观转录组特异性
随后,作者将内源性甲基化序列的甲基化水平与其阴性对照序列进行了比较。结果发现92.8%的内源性甲基化序列和90.2%的内源性非甲基化序列在该报告试验中均表现出显著的甲基化水平,并且内源性非甲基化组的MPm6A富集分数与内源性甲基化组相似,表明大多数内源性甲基化位点的甲基化并不严格要求其周围的内源性背景(图2A)。因此,数以千计的内源性未甲基化的DRACH位点在脱离其内源性背景并在人工报告背景下表达时均产生了甲基化,作者就把这些确定的位点称为 " suppressed m6A sites "。同时,作者发现许多序列在CDS或5′UTR内表达时,m6A富集程度明显低于3′UTR内,这表明5′区一般比3′区更不利于m6A的甲基化(图2B、2C)。总的来说,这些结果揭示了数以千计的被抑制的m6A位点的存在,它们被未知的机制所沉默。
图2
此外,被抑制的m6A位点在CDS和3′UTR中富集,而在终止密码子附近被耗尽,这与内源性m6A位点的富集正好相反(图3A)。内部外显子中被抑制的m6A位点位于比内源性m6A位点(中位数=915 nt)短得多的外显子内(中位数=167 nt)(图3B)。这些结果表明,长内部外显子中内源性m6A的富集可能是抑制m6A在较短内部外显子中沉积的结果(图3C)。此外,942个含有被抑制的m6A位点的基因在其转录本上不包含任何内源性的m6A峰(图3D)。这些位点的抑制似乎涉及对m6A沉积的抑制,而不是主动去甲基化,因为与被抑制的m6A位点相比,METTL3-METTL14甲基转移酶复合体附属亚基RBM15的结合位点在内源性m6A位点附近高度富集,而FTO和ALKBH5结合位点在被抑制位点附近没有明显富集。这些结果是出乎意料的,因为以前关于m6A特异性的报告主要集中在激活机制上。作者的MPm6A检测结果表明存在未知的m6A "抑制物",它们通过抑制m6A的沉积来调控全局m6A特异性。
图3
三、Pre-mRNA剪切抑制剪接位点附近的m6A甲基化
接下来,作者检查了内源性甲基化与被抑制的m6A位点附近120个RBPs的结合位点的相对富集程度,以确定候选抑制因子。由于CDS中被抑制的m6A位点主要位于平均长度的内部外显子内,作者假设平均长度的内部外显子的剪接可能抑制m6A甲基化。为了验证这一点,作者从CRY1基因的一个平均长度的内部外显子(图4C)中克隆了一个被抑制的m6A位点到兔子的β-珠蛋白(BG)微型报告基因中,以及一个去除内含子的版本(BG Δi1, i2)。结果发现,剪接后的构建体显著抑制了位于内部外显子的序列甲基化,但在最后一个外显子内则没有发生(图4D)。而去除任何一个内含子(BG Δi1 CRY1 102, BG Δi2 CRY1 102)都会导致抑制作用的部分丧失,表明两个内含子的剪接对甲基化抑制具有贡献作用(图4A)。将被抑制位点周围的CRY1外显子序列的912 nt克隆到内部外显子中(BG CRY1 912),形成一个长的内部外显子,结果导致抑制的丧失(图4A)。由此,作者推测这种抑制作用取决于外显子中心的m6A位点与剪接位点的接近程度。这些结果揭示了pre-mRNA的剪接在m6A调节中的因果作用。
图4
四、外显子连接复合物控制m6A外显子组的特异性
已有研究表明,外显子连接复合物(EJCs)是由剪接体沉积到exon-exon连接处上游约24 nt的mRNA上,并在基因表达调节中发挥多方面的作用。EJCs与相互作用的富含丝氨酸和精氨酸的SR蛋白(serine/arginine-rich protein)一起包装压缩mRNA,并能在体外保护长链近端RNA免受体外核酸酶的攻击,也能在体内阻止5′到3′外切酶的降解。由此,作者假设EJCs可以介导观察到的剪接位点近端抑制m6A的作用。首先作者在HeLa细胞中敲除(KD)核心EJC因子EIF4A3,通过m6A-MeRIP-seq发现有 24,350个区域在EIF4A3 KD后明显超甲基化,而3140个区域低甲基化(图5A)。此外,作者还敲除了另一个核心EJC因子RBM8A,并观察到类似的但相对缓和的全转录组m6A变化,其中57%与EIF4A3 KD中观察到的超甲基化区域重叠(图5A-C)。EIF4A3 KD的94%的超甲基化区域和RBM8A KD的82%的超甲基化区域,与非靶siRNA对照条件下确定的m6A峰不重叠,表明这些区域含有新的甲基化抑制的m6A位点(图5A,5B和5F)。事实上,在MPm6A确定的1,024个含有抑制性m6A位点的CDS序列中,46%在EIF4A3和/或RBM8A KD后变得甲基化,包括CRY1抑制性位点(图5G),有三个选定的抑制性位点得到验证(图5H,5I)。此外,EIF4A3 KD大大缓和了先前观察到的BG CRY1 102内部外显子内的m6A抑制作用(图5J)。
图5
与作者构建的模型一致,新的甲基化和超甲基化区域在CDS内平均长度的内部外显子中高度富集(图6A-C,以及图5K,5L),在EIF4A3或RBM8A KD后,整个转录组在exon-exon连接处近端区域的m6A富集程度增加(图6D,6E)。EIF4A3 KD在全局范围内破坏了m6A外显子组的特异性,导致m6A峰在长的内部外显子中的富集大量丧失,并且相对于终止密码子,CDS中的m6A密度增加(图6G,6H)。此外,EIF4A3 KD也导致last exons开始后150 nt以内的m6A富集程度增加(图6D-F),表明EJC对last exon-exon连接处附近甲基化水平的抑制是造成终止密码子附近m6A峰增多的原因。EIF4A3 KD时,虽然大多数转录本表现出超甲基化,但超过1000个缺乏内源性m6A峰的转录本也获得了异常的m6A甲基化,揭示了EJC在抑制不受m6A调节的转录本子集上的m6A沉积的主要作用(图6G-I)。
图6
随后,作者在HeLa细胞中用不同的siRNA耗尽EIF4A3,并在HEK293T细胞以及对EIF4A3扰动敏感的胶质母细胞瘤细胞系(U87)中敲除EIF4A3,并在每种情况下观察到了类似的全转录组m6A变化(图7)。结果表明剪接体通过沉积EJCs广泛抑制m6A甲基化,保护近端RNA免受甲基化。
图7
五、EJCs通过抑制m6A甲基化调节mRNA的稳定性
已知m6A主要通过reader蛋白YTHDF2加速mRNA的降解。作者观察到EIF4A3 KD后,约90%的超甲基化转录本mRNA半衰期整体缩短(图8)。虽然绝大多数超甲基化转录本的稳定性被 EIF4A3 KD 破坏,但一小部分超甲基化转录本被稳定。这说明,虽然EJC介导的m6A抑制主要是通过阻止YTHDF2介导的衰变来稳定mRNA,但在少数情况下,超甲基化的转录本可以通过其他机制来稳定,比如通过结合IGF2BPs。
图8
六、通过EJC抑制不同组织和物种的m6A甲基化差异
作者构建的模型表明,细胞的EJC水平可能会影响不同组织中全局mRNA m6A的沉积。事实上,作者发现在25个不同的人类组织中,EIF4A3表达水平和全局mRNA m6A修饰水平之间呈负相关(图9A)。这些基因的m6A水平也与它们的转录物丰度呈负相关(图9B)。在小鼠组织中也观察到类似的趋势(图9C)。这些结果进一步支持EJCs对m6A的抑制以及随后对哺乳动物组织中的mRNA稳定性调节。值得注意的是,在脑组织中EIF4A3的表达量最低,而mRNA m6A总体水平最高(图9A)。作者通过进一步比较人类小脑(EIF4A3水平最低,总体mRNA m6A最高)和心脏(EIF4A3水平较高,总体mRNA m6A较低)的甲基化水平,发现小脑中超甲基化区域位于短的内部外显子内(图9D),表明小脑中EIF4A3的低表达减弱了对m6A的抑制。这些结果进一步表明,EJCs的广泛抑制有助于组织特定的m6A沉积。
图9
七、EJCs和外围EJC因子RNPS1保护exon-exon连接处的近端RNA区域免受异常mRNA加工的影响
细胞核中的EJCs多聚体能够与外围EJC因子RNPS1相结合,并且也与各种SR蛋白结合,能够将mRNA包装并压缩成高阶高质的mRNPs,其近端RNA远超常规EJC沉积位点。由于这种包装,近端RNA的几十到几百个核苷酸被这种巨型复合体保护起来免受核酸酶的消化。为了研究EJC介导的mRNA包装是否抑制近端mRNA甲基化的功能,作者从细胞提取物中分离出EJCs/EJC结合的RNA,用体外核酸酶处理消化掉物理上可接触的RNA,然后测量受EJC保护的RNA片段上的m6A水平(图10A,10B)。结果发现EJC保护的RNA片段明显耗尽了m6A水平,表明这些不可接触的RNA片段在很大程度上受到保护,不会在细胞内沉积m6A(图10C)。EJCs还保护这些片段不被重组的METTL3-METTL14体外甲基化(图10D)。这说明在甲基化反应中加入的未甲基化RNA以及去蛋白化片段都被显著甲基化了(图10D,10E)。因此,EJCs通过包装近端RNA来抑制局部m6A的沉积。
图10
由于在这些高度包装的mRNP结构中,外周EJC因子RNPS1与高分子量的EJC相关联。接下来,作者对该因子的作用机制进行了研究。结果发现敲除RNPS1会导致平均长度的内部外显子和CDS区域内的大量转录本m6A超甲基化(图11A-C,图12A-C),并且siRNPS1超甲基化区域与siEIF4A3/siRBM8A超甲基化区域之间高度重叠(45%)(图11C,12C)。在整个转录组范围内,EJC抑制的剪接位点与EJC抑制的m6A位点显著共定位(图11C-E,图12D-F)。总的来说,这些结果表明,与RNPS1相关的EJC通过包装近端RNA来抑制内源细胞的m6A甲基化和剪接,并指出外显子结构是局部RNA对调节机制可及性的重要决定因素。
图11
图12
总结
该研究当中,作者利用m6A甲基化的大规模平行检测(MPm6A)工具,鉴定了第一个m6A“抑制器”:外显子拼接复合体(EJCs)。作者发现EJCs协同外周因子RNPS1对近端mRNA包装,从而抑制外显子结附近的m6A甲基化;在转录组上,数千至上万的m6A位点受EJCs以依赖外显子长度的方式的抑制,而远离外显子结的长内部外显子和终止密码子附近m6A位点可以逃脱这一抑制,因此造成了m6A特殊的全局分布,包括区域选择性和转录本选择性。这种EJCs介导的m6A甲基化抑制机制对于维持正常的基因表达至关重要,EJCs缺失导致mRNA的普遍m6A超甲基化,进而招募更多的m6A “readers”,造成m6A介导的转录本不稳定。最后,作者发现EJCs抑制的m6A甲基化位点与EJCs抑制的剪接位点高度共定位,说明 除了m6A甲基转移酶复合体,EJCs对外显子结近端mRNA的包装广泛地影响mRNA调控机制对局部mRNA的可及性。
总之,何川教授团队的这项工作解决了表观转录组学领域长期以来的一个谜团,是对m6A介导基因调控机制基本理解的重大进展。这一研究具有广泛的影响,因为EJCs对于mRNA的包装功能不仅影响m6A甲基转移酶,也普遍抑制其他mRNA调控机制对外显子结近端mRNA的可及性,从而对基因表达调控产生更广泛的影响。
相关阅读
m6A研究中的常见生信图表有哪些?
PBJ综述:m6A介导的作物发育和胁迫反应的调节|m6A专题
干货 | m6A专题大更新(20230224更新)
所见即所得,绘图高规格联川云平台,让科研更自由